查看原文
其他

研究结果阴性,可能统计方法不合适!

2017-05-12 王彩云 医咖会

当一个临床研究得到阴性结果时,研究者典型的第一反应是:什么出错了?治疗是否真的无效?是否还有一线希望?接下来该怎么做? 


新英格兰医学杂志发表的一篇文章,列举了试验的主要结局为阴性时,应该考虑的问题[1]

上一期我们讨论了第9个问题:“次要结局显示阳性结果吗?”。今天我们来继续讨论第10个问题:“改变分析方法有帮助吗?”。


要知道,选择什么样的数据统计方法对于临床试验来说非常重要,古人言“行百里者半九十”,数据统计分析和结果解释就是那最后的“十”。不论你在试验设计、过程执行等方面如何标准、如何严格,如果选择了不恰当的数据统计方法,那么很可能得到阴性结果甚至完全相反的结果。


所以,如果你的临床试验数据分析结果为阴性,也不妨反思下自己的统计方法是否合适,或者尝试做出改变。下面,我们将结合临床试验实例给大家介绍几种临床试验中常用的数据分析方法,或许能给你一些提示~

一、协变量校正

协变量是指受试者在开始临床试验之前被测定或观察到,预期会对所分析的因变量产生影响的定性或定量变量,如年龄、体重、疾病特征或研究中心等。协变量校正就是在数据统计时应用数学模型评估协变量的变化对研究结果的影响,是统计学中必不可少的一个重要环节。将与主要结局密切相关的基线变量作为协变量进行校正分析可提高统计效力。


下面我们用强化降胆固醇水平预防脑卒中(SPARCL)试验为例来具体说明。


SPARCL试验[2]是比较阿托伐他汀与安慰剂治疗卒中或短暂性脑缺血发作(TIA)患者疗效的大型二级预防临床试验。试验将4731例前1-6月内患有脑卒中或TIA的患者随机双盲分别给予阿托伐他汀或安慰剂治疗,随访中位年限为5年。主要结局为首次发生致死或非致死性卒中。


研究者分别使用未校正和协变量校正两种方法对该数据进行统计分析。未校正的分析结果显示,相比安慰剂组,阿托伐他汀组的主要结局呈改善趋势(11.2% vs. 13.1%),绝对危险减少2.2%(P = 0.05);使用地理区域、入组疾病特征及其持续时间、年龄和性别等基线因素作为协变量进行校正分析后显示,相比安慰剂组,阿托伐他汀组的主要结局发生风险比为0.84(95% CI, 0.71-0.99;P = 0.03)(图1)。

然而,如果在临床试验方案设计之初没有预先说明协变量,或者没有预先将协变量校正分析作为主要分析方法的话,那么协变量校正分析的结果应当视为有趣的探索,而并非能够对试验主要结论产生重大影响。


因此,在尚不清楚SPARCL试验预先设定的主要分析方法且显著性水平为5%的前提下,SPARCL试验的结果究竟是否为阳性颇受争议。据此,更为合理的结论是,SPARCL试验有中等程度的证据提示,对卒中或TIA患者应用阿托伐他汀积极降胆固醇治疗是有益的。

二、接受治疗分析或符合方案集分析

意向性治疗(ITT)分析是依据受试者的随机分组情况对两种干预措施进行比较的主要方法,即一旦受试者被随机分配至某一处理组后,不管他们是否完成试验,或者是否真正接受了该组治疗,都保留在原组进行结果分析。


但是受试者的不依从性或治疗交叉可能会掩盖真正的治疗效果,而导致意向性治疗分析不能发现处理组间的统计学差异,因此有研究者认为,这种情况下采取接受治疗分析或符合方案集(PP)分析更接近真相。遗憾的是,接受治疗或符合方案集分析会引入选择偏倚,因为对于那些不依从治疗方案或出现治疗交叉的患者而言,其出现的不同结局可能与实际接受治疗无关。


(相关阅读:不明觉厉的统计学术语之ITT分析


临床试验的疗效结论仍以意向性治疗分析的结果为主,接受治疗分析和符合方案集分析的结果可作为补充和参考;不过当试验目的为检验干预措施安全性时,接受治疗分析是可行的。


下面将通过缺血性心力衰竭外科治疗试验(STICH试验)作具体说明。


STICH试验[3]比较冠状动脉搭桥术(CABG)联合药物治疗和单纯药物治疗对于左心功能不全患者的疗效。试验纳入1202例左室射血分数≤35%、冠状动脉疾病符合CABG指征的患者,随机分为单纯药物治疗组(602例)和CABG联合药物治疗组(610例),平均随访56个月。试验主要结局为全因死亡,重要次要结局包括心血管死亡、全因死亡和心血管住院。


在本试验中,单纯药物治疗组有17%的患者在随访结束前交叉接受了搭桥术,CABG组有9%的患者交叉接受了单纯药物治疗。


意向性治疗分析显示,相比单纯药物治疗组, CABG组全因死亡的风险比为0.86(36% vs. 41%; 95% CI, 0.72-1.04; P = 0.12),即CABG联合药物治疗与单纯药物治疗的主要结局没有显著差异(图2A)。然而,接受治疗分析及符合方案集分析的结果却显示,CABG联合药物治疗可有效降低全因死亡的发生率。


接受治疗分析显示,随访第1年期间接受CABG治疗(包括交叉到CABG组)的患者,相比仅仅接受药物治疗的患者,全因死亡的风险比为0.70(95% CI, 0.58-0.84; P<0.001)(图2B);符合方案集分析显示,随访第1年期间CABG组进行了CABG术的患者,相比单纯药物治疗组未交叉接受CABG的患者,全因死亡的风险比为0.76(95% CI, 0.62-0.92; P = 0.005)(图2C)。尽管STICH试验中实际处理分析的结果为阳性,主要结论仍应以意向性分析结果为主,即单纯药物治疗与CABG联合药物治疗的主要结局没有显著差异。


但是在STICH试验意向治疗人群中可观察到CABG能够改善心血管死亡(HR 0.81; 95% CI, 0.664-1.00; P = 0.05)以及死亡和心血管住院的复合结局(HR 0.74; 95% CI, 0.64-0.85; P<0.001)。此外,STICH试验为期10年的随访数据[4]显示,意向治疗人群中,与单纯药物治疗相比,CAB联合药物治疗可降低全因死亡率(HR 0.84; 95% CI, 0.73-0.97; P = 0.02)(图2D)。所有这些证据均提示CABG对于左心功能不全患者有着重要的作用。

三、重复事件分析

在慢性疾病相关干预措施的临床试验中,传统的复合终点分析往往只关注事件第一次发生的时间,而忽略之后发生的任何重复事件,这样的分析方法会严重降低统计效力并低估干预措施的疗效。因此在进行相关临床试验分析时,不妨尝试将重复事件考虑在内,或许会对干预措施的治疗获益有更全面的认识。


下面将以CHARM-Preserved试验为例进行说明。


CHARM-Preserved试验[5]比较坎地沙坦与安慰剂对于左室射血分数正常(LVEF>40%)的慢性心力衰竭患者的疗效。试验纳入3023例慢性心衰患者,随机分为坎地沙坦组(1514例)和安慰剂组(1509例),平均治疗随访36.6个月。该试验主要结局为心力衰竭导致心血管死亡或入院的复合终点。


该试验结局数据的分析采用了两种方法,一种为传统分析方法,即只考虑因心力衰竭导致首次入院或心血管死亡的时间。结果显示,相比安慰剂组,坎地沙坦治疗组主要复合终点事件发生风险无显著差异(HR 0.89;95%CI, 0.77-1.03, P = 0.118)。


另一种为重复事件分析方法,即将心力衰竭导致的所有反复入院和心血管死亡时间纳入分析。结果显示,相比安慰剂组,坎地沙坦治疗可有效降低主要复合终点事件的发生风险(HR 0.75;95% CI, 0.62-0.91, P =0.003)和心力衰竭导致反复入院的发生风险(HR 0.68;95% CI, 0.54-0.85, P<0.001)(图3)。

结合上述分析结果,并考虑到反复住院是慢性心力衰竭的一个主要特征,因此CHARM-Preserved试验研究者提出“重复性事件应该常规纳入未来心力衰竭的临床试验分析中”,并认为坎地沙坦相比安慰剂可有效预防心力衰竭导致的反复入院。


综上可见,临床试验数据统计方法的选择非常多样,但是一定要根据自己的试验目的、基线数据和结局数据特征选择适当的方法,并对统计结果进行合理的解释。


小提示:本文想说明的是要选择恰当的统计方法,不代表说结果阴性,就不停换统计方法,直到得出阳性结果。之前有小伙伴也会咨询说,我得到的P值大于0.05,能不能换个统计方法,就变得有统计学意义呢?如果已经选择了合适的统计学方法,得出的结果为阴性,只寄希望于换种方法就能有所改变,这种是不可取的。正如文章开头所讲,试验的主要结局为阴性时,我们要思考很多问题,而不应该只盯着统计方法,将其视为万能钥匙。)


参考文献

1. N Engl J Med. 2016; 375: 861-70

2. N Engl J Med. 2006; 355: 549-59

3. N Engl J Med. 2011; 364: 1607-16

4. N Engl J Med. 2016; 374: 1511-20

5. Eur J Heart Fail. 2014; 16:33- 40


相关阅读

1. 【合集】23种统计方法的SPSS详细操作

2. 研究主要结局阴性,次要结局阳性,你怎么看?

3. 试验结果阴性,看看亚组分析?

4. 试验结果阴性,有可能试验实施过程中出现了这样的问题!

医咖会微信:medieco-ykh

关注医咖会,涨姿势!


我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群和其他小伙伴们一起交流学习。


点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存